摘要。自动驾驶(AD)的数据驱动方法在过去十年中已被广泛采用,但面临着数据集偏见和无法解释性。受到人类驾驶的知识驱动性质的启发,最近的方法探讨了大型语言模型(LLMS)的潜力,以改善交通情况中的理解和决策。他们发现,使用经过三通链(COT)推理过程的下游数据上LLM的预处理范式可以增强可解释性和场景的理解。,这种流行的策略被证明遭受了臭名昭著的概率,而精制的婴儿床与随之而来的决策不符,而这种决策仍未受到以前基于LLM的AD方法的影响。为了解决这个问题,我们激励了基于多模式的LLM的端到端决策模型,该模型同时执行COT推理并执行计划结果。fur-hoverore,我们提出了配对的婴儿床和计划结果之间的推理决策对准约束,并在推理和决策之间施加了对应关系。此外,我们重新设计了COTS,以使模型能够理解复杂的方案并增强决策绩效。我们将建议的大型语言规划师与推理决策对齐为RDA驱动器。对Nuscenes和Drivelm-Nuscenes基准的实验评估证明了我们的RDA驱动器在增强最终AD系统性能方面的有效性。具体来说,我们的RDA驱动程序在Nuscenes数据集上实现了最先进的计划性能,具有0.80 L2误差和0.32的碰撞率,并且在挑战Drivelm-nuscenes基准方面取得了领先的结果,具有0.82 L2 L2误差和0.38碰撞率。
主要关键词
![arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第1页](/bimg/d/dfd4b76199728e3a9f8405db5783a17d1af950ee.webp)
![arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第2页](/bimg/3/34f0665c5137d2f4f5b0201cd31c5028fc1d807c.webp)
![arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第3页](/bimg/4/4a1307a6a5c9a9784051e1233acdb92e5119689c.webp)
![arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第4页](/bimg/1/1df819534d40bfbad176bc1bf6dc2831b19ac48e.webp)
![arxiv:2408.13890v1 [cs.cv] 2024年8月25日PDF文件第5页](/bimg/2/28a2b62f4abce0443eda787b03f1ec02201a91a9.webp)
